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基于 GEP 的 高 速 公 路 通行 费 预 测 方法 研究 ， 
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摘 要 : 高 速 公路 通行 费 未 来 收入 状况 的 预测 对 于 高 速 公 路 运营 管理 、 建 设 规划 有 着 重要 的 指导 意义 。 然 而 ， 通 行 费 
收入 水 平 的 变化 受到 多 方面 国 素 的 影响 ， 具 有 较 强 的 非 线性 和 复杂 性 ， 传 统 预测 模型 无 法 准确 表达 通行 费 收 入 的 发 展 
规律 。 针 对 复杂 的 高 速 公路 通行 费 预测 问题 ,建立 了 基于 基因 表达 式 编程 算法 (GEP) 的 高 速 公路 通行 费 预测 模型 。 该 模 
型 利用 GEP 算法 建立 通行 费 当 前 收入 与 历史 数据 之 间 复 杂 的 函数 关系 ,准确 地 刻画 通行 费 收入 随时 间 的 发 展 规律 。 此 
外 ， 针 对 节假日 期 间 通 行 费 减免 政策 的 影响 ， 提 出 了 有 效 的 修正 模型 。 最 后 ， 采 集 了 浙江 沪 杭 前 高 速 公路 股份 有 限 公 
司 等 12 家 公司 通行 费 收入 的 历史 数据 进行 仿真 实验 ,对 比 传统 的 ARIMA 以 及 神经 网 络 预测 模型 ,结果 充分 验证 了 本 
文 算法 的 有 效 性 和 准确 性 
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Research on freeway toll prediction method based on GEP 


Liu Ning, Huang Zhangcan, Tan Qing 
(School of Science, Wuhan University of Technology, Wuhan 430070, China) 


Abstract: The prediction of the future income of highway toll has great guiding significance for the management and 
construction planning. However, the change of toll income is influenced by many factors. It has strong nonlinearity and 
complexity. The traditional prediction model cannot accurately express the development law of the toll income. In this papet, a 


highway toll prediction model based on gene expression programming algorithm (GEP) is established. The GEP algorithm is 


used to establish a complex functional relationship between current income and historical data, which accurately characterize 
the development rule of toll income over time. In addition, an effective correction model is proposed for the influence of toll 
reduction policies during holidays. Finally, this paper collects the historical data on the toll revenue of 12 companies such as 


shanghai-hangzhou-ningbo Expressway Co. , Ltd. Compared with traditional ARIMA and neural network prediction model, and 


the results fully verify the effectiveness and accuracy of the proposed algorithm. 
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题 。 在 众多 的 影响 因素 中 ， 收 费 政策 的 影响 具有 突变 性 和 不 可 
预测 性 ， 给 通行 费 收 入 水 平 的 预测 带 来 了 困难 。2012 年 起 ， 根 
时 间 序 列 预 测 方法 是 一 类 典型 的 预测 问题 ， 在 实际 生产 4 虽 有 关 部 门 的 相关 政策 ,在 4 个 重大 节假日 (春节 、 清 明 节 、 劳 
活 中 有 着 广泛 的 应 用 。 本 文 基于 高 速 公路 通行 费 收 入 的 时 间 序 。 动 节 、 国 庆 节 ) 期 间 ，7 座 以 下 ( 含 ) 小 型 客车 免 收 通 行 费 ， 从 而 
列 样本 数据 ， 对 通行 费 收 入 变化 的 预测 问题 展开 研究 ， 对 指导 ”造成 对 应 时 间 段 内 通行 费 收入 变化 趋势 发 生 不 规律 的 剧烈 波动 ， 
高 速 公 路 投资 者 和 相关 职能 部 门 进行 运营 管理 、 发 展 规划 以 及 ”这 也 是 造成 最 终 预 测 精度 产生 偏差 的 重要 因素 之 一 。 

局 部 建设 有 着 重要 的 意义 口 。 在 己 有 的 高 速 通行 费 预测 研究 中 ， 主 要 是 基于 对 高 速 公 路 
高 速 公 路 通行 费 由 通过 收费 站 点 的 车 辆 产生 ， 由 通行 车 辆 ， 车 流量 的 预测 来 间接 实现 通行 费 预测 。 对 于 交通 流 车 流量 的 预 
的 类 型 和 数量 所 决定 。 同 时 ， 高 速 公 路 通行 费 收 入 水 平 的 变化 。 测 问题 , 经 典 预测 模型 包括 有 : 历史 平均 法 自 、 指 数 平滑 法 外 和 
情况 复杂 ， 与 气候 、 天 气 、 经 济 发 展 、 环 境 和 政策 等 多 方面 的 ”卡尔 曼 滤 波 回 等。 然而 ,上述 方 法 原理 比较 简单 ,都 是 基于 样本 
因素 有 关 ， 传 统 的 时 间 序 列 预测 模型 在 该 预测 问题 上 表现 较 差 ” 数据 的 统计 特性 出 发 进行 预测 建 模 ， 预 测 精度 较 差 。 同 时 这 类 
中 ， 建 并 有 效 的 预测 模型 提高 预测 精度 是 一 项 具有 挑战 性 的 难 ” ”方法 还 有 一 个 假设 前 提 ， 即 未 来 的 数据 变化 与 过 去 的 数据 具有 
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相同 的 特性 。 但 是 ， 在 高 速 公路 预测 问题 中 ， 
政策 所 造成 的 通行 费 收 入 突变 是 无 法 通过 


于 节假日 减免 
寸 上 述 模型 的 简单 原理 


来 刻画 的 。 
为 了 提高 通行 费 预测 精度 ， 人 们 提出 了 更 加 复杂 的 非 线 性 
模型 和 智能 预测 模型 ， 包 括 非 参数 回归 预测 方法 四 和 神经 网 络 


预测 方法 中 等 。 文 献 [8] 中 提出 了 一 种 基于 神经 网 络 的 改进 的 自 
可 归 积 分 滑动 平均 模型 (ARIMA) 预 测 方法 ， 该 方法 将 预测 分 为 
两 个 部 分 ， 首 先 通过 ARIMA 模型 对 模型 进行 预测 ， 其 次 利用 
神经 网 络 预测 方法 对 残 差 部 分 进行 预测 ， 通 过 结合 两 种 算法 来 
提升 预测 精度 。 但 是 这 种 方法 计算 相对 复杂 ， 并 且 存 在 容易 陷 
入 局 部 最 优 、 计 算 量 大 的 缺点 。 文 献 [9] 中 针对 线性 预测 方法 在 
交通 流 复杂 变化 趋势 预测 问题 上 的 局 限 性 ， 提 出 了 一 种 改进 的 
卡尔 曼 滤波 算法 ， 基 于 神经 网 络 算法 增强 算法 对 非 线 性 数据 的 
预测 能 力 ,文献 [10] 则 设计 了 一 种 基于 支撑 向 量 机 (SVM) 方 法 的 
交通 流 预 测 模型 。 上 述 通过 交通 流 预 测 模 型 的 通行 费 预 测 方法 
不 易 获取 历史 数据 ， 同 时 通行 费 与 通行 车 辆 类 型 、 费 率 等 有 关 
,间接 预测 会 产生 较 大 误差 。 对 此, 文献 [12] 中 提出 了 一 种 组 
合 预测 模型 ， 结 合 了 多 种 预测 模型 ， 直 接 对 通行 费 收入 数据 进 
行 建 模 和 预测 。 
同时 ， 现 有 研究 主要 基于 一 般 情 况 下 的 高 速 公路 交通 流量 
预测 结果 进行 交通 费 预 测 ， 很 少 考虑 到 重大 节假日 的 影响 。 
献 [13] 中 ， 作 者 在 灰色 马尔 可 夫 预 测 模型 的 基础 上 提出 了 一 种 
修正 算法 ， 通 过 计算 预测 残 差 的 概率 和 状态 来 提升 预测 精度 。 
文献 [14] 针 对 节假日 高 速 公 路 的 交通 流 的 特性 , 提出 了 EMD 和 
GS-SVM 融合 的 交通 流量 预测 模型 ， 通 过 对 比分 析 验 证 了 融合 
算法 的 准确 性 与 适应 性 。 但 是 ， 以 上 研究 方法 依旧 是 基于 交通 
流量 的 预测 ， 通 行 费 预测 结果 仍 存在 较 大 误差 。 
基因 表达 式 编 程 算法 (GEP) 在 复杂 函数 建 模 方面 表现 出 较 
高 的 拟 合 精度 和 较 快 的 收敛 速度 ， 使 其 具有 更 强 的 解决 问题 能 
力 。GEP 建 模 方法 能 够 根据 时 间 序 列 数据 的 特征 ， 挖 掘 发 现 数 
据 之 间 的 函数 关系 ， 并 建立 相关 预测 模型 。 文 献 [15] 基 于 GEP 
算法 提出 了 人 口 预测 模型 ， 该 模型 可 以 在 样本 少 的 情况 下 挖掘 
人 口 发 展 的 复杂 非 线性 模式 ,有 效 防止 了 过 度 拟 合 现象 的 发 生 ， 
提供 了 更 为 准确 、 合 理 的 拟 合 及 预测 结果 。 文献 [16] 针 对 股票 对 
象 的 特点 ， 提 出 了 适应 股票 规律 的 GEP-STOCK 模型 ， 对 股票 
涨 跌 情况 作出 了 预测 。 针 对 高 速 公路 通行 费 预测 的 复杂 性 ， 
文 提出 了 一 种 基于 GEP 算法 的 混合 预测 模型 来 刻画 通行 费 收 
入 的 变化 规律 ， 同 时 针对 节假日 限 免 政策 对 通行 费 收入 的 影响 
建立 修正 模型 ， 提 升 算法 的 预测 精度 。 


1 ”基因 表达 式 编程 算法 


基因 表达 式 编程 算法 (GEP) 在 2001 年 由 Ferreira 首次 提出 
7， 是 一 种 新 的 基于 基因 型 和 表现 型 的 自 适应 演化 算法 。GEP 
表现 出 其 先天 的 自 组 织 、 自 适应 和 自学 习 的 特性 ， 在 复杂 函数 
的 自动 建 模 能 力 上 具有 更 强 的 效果 08。 本 文 利 用 GEP 算法 
历史 数据 建立 当前 待 测 时 刻 通行 费 的 映射 函数 ， 根 据 通行 费 
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刘 宁 ， 等 : 基于 G 


据 变化 的 趋势 性 增长 求解 下 
1.1 基因 结构 和 编码 方式 
GEP 中 的 个 体 〈 或 染色 体 ) 由 一 个 或 若干 个 等 长 的 基因 序 
列 构 成 ， 基 因 编 码 由 头 尾 两 部 分 组 成 ， 运 算 符 和 终结 符 构成 头 
基因 ， 其 长度 户 根据 实际 需求 而 确定 ， 尾 基因 只 包含 终止 集 ， 
尾部 长 度 1 的 计算 表达 式 如 公式 (1) 所 示 : 
t=h*(n-1)+1 (1) 
其 中 ，n 表示 运算 符 集中 需要 的 变量 个 数 。 定 义 函 数 集 
F={2,*/ 一 +} ， 终 止 集 为 = {aq,Bp} ， 给 定 h=15,n =2， 则 根 
据 函 数 集 记 和 终止 集 T7 ， 得 到 基因 编码 
aQab+//+b+babbabbbababbaaa”， 如 图 1 所 示 : 


时 刻 的 通行 费 预 测 值 。 


> 


“b 十 a- 


0123456789012345678901 234567890 一 > 基因 序号 
四国 下 由本 a|a|aj 一 一 > 编码 序列 
一 一 一 一 一 一 一 


head tail 


图 1 基因 编码 示意 图 


图 1 中 的 基因 编码 对 应 表达 式 树 结 构 如 图 2 所 示 ， 基 因 终 
止 于 第 一 段 的 7 号 位 点 。 


图 2 基因 树 结构 图 


1.2 GEP 遗传 算 子 

为 了 使 种 群 往 更 好 的 方向 发 展 ， 在 产生 新 个 体 和 接受 新 结 
构 的 过 程 中 ，GEP 需要 借助 遗传 算 子 来 优化 种 群 。GEP 算法 有 
多 种 在 基因 序列 上 进行 操作 的 遗传 算 子 081， 主 要 包括 变异 、 插 
串 和 重组 。 

1) 变 异 

变异 操作 通过 变异 概率 选择 个 体 ， 变 异 的 位 置 也 是 通过 随 
机 选择 ， 变 异 点 所 处 的 位 置 不 同 ， 变 异 操作 也 不 相同 ， 同 时 会 
对 个 体 的 表达 结构 产生 不 同 的 结果 。 
2) 基 因 插 串 
插 串 操作 对 应 于 遗传 算法 中 的 变异 ， 通 过 截取 序列 中 的 基 
因 片 段 ， 插 入 到 其 他 位 置 完成 基因 的 遗传 。 需 要 注意 的 是 ， 头 
部 的 基因 片段 只 能 插入 到 头 部 。 该 操作 按照 操作 方式 不 同 ， 分 
种 方式 。IS 插 串 操作 不 能 选取 根 节 点 揪 串 ，RIS 
插 串 操作 智能 选取 根 节点 位 置 进行 操作 。 

3) 基 因 重 组 
因 重 组 操作 的 思想 类 似 于 遗传 算法 中 基因 的 交叉 操作 。 
该 操作 的 具体 内 容 是 选取 两 个 基因 中 的 某 个 片段 ， 然 后 将 对 应 
位 置 的 基因 片段 进行 交换 。 基 因 重 组 按照 交换 节点 方式 有 单 点 
和 两 点 两 种 不 同 的 重组 方式 。 
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1.3 GEP 适应 度 函 数 选择 


上 文中 指 


出 ， 通 行 费 | 


通行 车 辆 的 类 型 


本 文 使 用 参考 文献 09] 中 提 到 的 基于 相对 误差 的 适应 度 函 
数 ， 定 义 方式 如 下 所 示 : 
f= >w- S100) (2) 
其 中 ，jy 是 根据 具体 情况 设 定 的 适应 度 值 范围 ，C 为 群体 个 
数 ，C, ;是 基因 个 体 ; 对 第 j 个 样本 的 预测 结果 ,7 是 样本 j 的 
实际 目标 值 ， 所 求 的 即 为 第 ;个 个 体 的 适应 度 值 。 
1.4 GEP 的 基本 过 程 


针对 实例 分 析 需 要 解决 的 问题 ， 确 定 输入 和 输出 的 组 成 元 
素 以 及 算法 的 各 控制 参数 。 初 始 化 种 群 并 计算 适应 值 ， 判 断 是 
否 满足 条 件 后 进行 各 种 遗传 操作 ， 以 此 来 实现 种 群 的 进化 。 当 
算法 满足 终止 条 件 时 ， 输 出 最 优 个 体 或 模型 ，GEP 基本 过 程 如 
3 所 示 。 


加 


确定 终结 符 集 和 运算 
符 集 以 及 各 控制 参数 


初始 化 种 群 
划 
二 


计算 适应 度 值 


输出 最 优 个 体 


选择 最 优 个 体 


ET 


、 重 组 ) 


产生 新 一 代 种 群 


图 3 GEP 


基本 过 程 


2 ”基于 GEP 的 高 速 公路 通行 费 预测 算法 


2.1 高 速 公路 通行 费 收入 预测 


本 文 针对 通行 费 收入 的 预测 问题 展开 研究 ， 建 立 通行 费 当 
前 收入 数据 与 历史 数据 之 间 的 发 展 关系 ， 从 而 根据 历史 数据 实 
现 对 下 一 时 刻 的 通行 费 收入 的 预测 。 假 定 通行 费 收入 的 历史 数 
据 为 {x0,x,%,…x,} ,建立 未 来 通行 费 与 历史 数据 之 间 的 函数 关 


系 ， 如 公式 (3) 所 示 : 


2 ]) G) 


A AC 


其 中 ， 如 何 建立 准确 有 效 的 映射 函数 关系 f[.] 是 本 文 研究 的 重 
点 ,该 函数 模型 可 以 表现 通行 费 收入 时 间 序 列 数据 的 特征 规律 ， 
建 yA 优化 标 函 函数 如 下 式 (4) 所 示 : 
min P= 3 充 = f(a) (4) 
1 j=1 


其 中 免 表示 i 时 刻 通行 费 的 预测 值 。 


气息、 天气、 区 域 文化 、 经 济 以 及 收费 政策 等 多 种 因 
行 费 收 入 数据 的 变化 具有 很 强 的 非 线性 和 突变 性 ， 传 
统 的 预测 模型 无 法 准 


因此 ， 通 


确 描述 数据 的 变化 规律 


悍 . 长 革 


果 精 度 不 高 。 
数据 发 展 规律 ， 


额 预测 


尤其 


针对 此 问题 ， 本 文 在 原 
问题 转换 为 收入 金额 增长 率 的 
代 模 型 式 (3) 中 的 


是 长 期 预 涡 
模型 不 够 强健 ， 最 终结 


预测 


妇 入 数据 ， 


建立 的 函数 关系 进行 通行 费 收 入 预测 。 


2.2 基于 GEP 


的 通行 费 收 入 预测 模型 


考虑 到 高 速 公路 收费 站 通行 费 收入 在 节 


间 段 具有 周期 


收入 增长 率 替 


性 变化 的 特征 ， 同 时 
素 ， 通 行 费 收 入 序列 呈现 出 长 共 
沿 着 茶 一 方向 递增 发 展 


模型 的 基础 上 ， 
预测 问题 ， 


和 数量 所 决定 ， 与 


素 相关 。 


， 导 臻 最终 预测 结 


问题 中 ， 传 统 模型 无 法 准 


确 表达 


果 可 信和 度 较 低 。 


将 通 


行 费 收入 金 


即 


] 增 长 率 夫 


利用 GEP 算法 对 增长 率 历史 数据 


假日 等 其 他 特殊 时 


了 


代 收 入 金额 建立 预测 模型 ， 


应 的 通行 费 月 收入 增长 率 数据 为 


一 起 


其 中 ，p 表示 时 


测 模型 如 下 


其 中 : 


fl*]。 
2.3 


c 表示 选取 的 周 
的 收入 增长 率 预 测 
预测 值 , 本 文中 采 


间 序 列 周 期 性 


[会 经 济 快速 发 展 等 因 
趋势 性 ， 表 现 为 在 一 定时 期 内 
P91 针对 这 一 特点 , 本 文通 过 差 


分 操作 ， 


其 中 有 相 邻 年 份 对 


和 趋势 怕 


(5) 


变化 的 时 间 间 隔 (本 文中 p =12)， 


根据 相 邻 年 份 间 的 增长 率 存在 一 定 的 关联 性 E， 建 立 预 


yp (yo; D(a Dp 四 y, 


Nrp =(1 本 py) 加 


值 ， 工 ， 
用 GEP 算法 确定 描述 


KK 


该 预 


通行 费 收 入 预测 算法 
如 2.2 模型 


所 述 ， 


测 过 


(6) 


(7) 


基数 (本 文中 。=2 )， yw, 表示 下 一 时 刻 
, 则 表示 对 应 时 刻 的 通行 费 收入 金额 
士 程 的 映射 函数 


通行 费 收 入 增长 率 的 确定 对 预测 结果 起 


到 了 决定 性 作用 ， 长 期 趋势 性 主要 表现 在 过 去 通行 费 收入 对 当 
前 待 测 时 段 通行 费 预 测 的 影响 。 利用 GEP 算法 对 差分 后 的 历史 
数据 建立 函数 关系 ， 选 取 收 入 增长 率 数据 作为 输入 因子 ， 收 入 
增长 率 预测 函数 6 作为 输出 因子 ， 算 法 步 又 如 下 ; 

输入 : 增长 率 历 史 数 据 、 种 群 大 小 、 基 因 头 尾部 及 所 有 吐 
传 算 子 参数 。 

输出 :收入 增长 率 预 测 模型 /。 

建 模 过 程 

g) 设 置 自 变量 、 函 数 符 集 F 和 终结 符 集 T; 


b) 初 始 化 种 群 ， 


计算 适应 度 值 ; 


中) 保留 最 好 个 体 ， 进 行 选择 、 
6) 转 到 b) 进 行 
了 满足 最 大 适 


复制 、 


A 


循环 操作 ; 


应 度 值 或 迭代 次 数 时 ， 输 出 


[A 


异 等 遗传 操作 ; 


判断 最 大 适应 度 值 。 若 满足 ， 转 到 了; 若 不 满足 ， 继 续 执 


预测 模型 。 
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计算 预测 值 : 选取 历史 增长 率 数据 代入 预测 模型 
据 模型 式 (6)(7) 得 到 增长 率 y 
整体 预测 算法 框架 如 图 4 所 示 。 


n+p 


ee 


通 
行 
费 
收 广 增长 率 六 增长 率 记 上 增长 率 
入 i yn 
Xap 
| 
GEP 构 建 模型 
v 
输出 关于 增长 率 的 
预测 模型 
» =f (201 yp) 
v 
计算 待 测 年 份 增长 率 
A 


通行 费 收入 预测 值 


图 4 预测 算法 


2.4 通行 费 预测 模型 的 局 部 修正 


重大 节 候 


4 #6 ， 并 根 
和 收入 金额 x,,, 的 预测 值 。 


日 期 间 的 通行 费 限 免 政策 会 给 对 应 月 份 通行 费 收 


入 带 来 巨大 的 影响 ， 特 别 是 春节 ， 


和 时 间 影 响 上 的 持续 性 ， 使 得 在 对 应 


期 的 不 固定 性 
月 份 的 通行 费 收入 变化 趋 


势 上 的 预测 越发 困难 。 针 对 该 问题 ， 本 文 在 预测 模型 
建立 修正 模型 ,对 春节 假期 对 应 月 份 通行 费 
段 期 对 通行 费 收入 
为 基准 点 的 通行 费 收入 曲线 的 变化 趋势 是 相同 
收入 为 研究 对 象 ， 因 此 ， 假 期 对 应 
统计 1901 到 2050 年 的 关 
应 的 日 期 主要 和 集中 在 1 月 21 日 到 
同 ， 对 通行 费 收 入 的 影响 也 就 不 同 。 
月 份 和 2 月 份 间 隔 的 长 短 来 定义 


全 


响 也 是 不 同 的 。 


的 基础 上 


1 进行 修正 。 
此 以 春节 
的 。 本 文中 以 月 


的 影响 是 大 致 本 


对 所 在 月 份 的 影 
居 可 以 发 现 ， 春 节 对 
日 之 间 。 春 节 时 间 不 


低 


二 


先 选 取 2 月 5 日 


为 日 期 的 基准 点 ， 通 过 计算 春节 


关系 来 对 通行 费 收入 进行 修正 。 
因为 , 春节 假期 主要 对 1、2 月 份 通行 费 收 入 有 影响 ,对 应 


的 修正 的 通行 费 增长 模型 为 ; 


=1-(D,,-D. 
六 =(1+D;,,,)/(1+D,,)-1 


日 基 


其 准点 之 间 的 相对 位 置 


其 中 : y',y, 表示 修 


其 中 : & e(0,1] 表示 春节 假 


d，, 是 与 春节 晶 


a) 若 春节 位 了 
点 (2 月 5 日 ) 的 昌 
到 基准 点 (2 月 5$ 


日 期 与 1 


(8) 


E 后 的 通行 费 增长 率 ;，D,, 表示 第 1 年 春节 
日 期 对 通行 费 收入 影响 的 参数 。 六, 的 计算 表达 式 如 下 : 
D,=6.d, 

D,,=6:d,, 

期 对 通行 费 月 收入 的 影响 系数 。 4d， ， 
期 相关 的 两 个 距离 ， 定 义 方式 如 下 : 


(9) 


期 到 基 ; 


F 1 月 份 ，d ,表示 第 1 年 春节 对 应 日 


E 离 ， 心 ,为 春节 日 


日 ) 的 距离 ; 


期 的 统计 终止 点 (2 月 20 日 ) 


b) 若 春节 位 于 2 月 份 ,d,, 表示 春节 晶 
日 ) 到 基准 


期 的 统计 起 始点 (1 月 


naXiv 合 作 期 刊 


速 公路 通行 费 预 测 方法 研究 


行 费 预测 模型 式 (6)， 得 到 修正 忒 


仿真 实验 


数据 来 源 与 参数 设 定 


点 (2 月 5 日) 的 距离 , q,, 第 1 年 春节 对 应 日 期 到 基 
日 ) 的 距离 。 
正 后 的 增长 率 交 和 交代 入 2.2 中 基于 GEP 算法 的 通 


结果 。 


二 对 高 速 公 路 通行 费 收 入 预测 问题 的 大 
站 12 家 公司 〈 包 括 浙 江 沪 杭 甬 高 


高 速 公 路 有 限 公司 


AS 
] 等 ) 


预测 方法 的 有 效 性 


F 5 年 区 
速 公 路 有 限 公 司 分 
后 的 通行 费 收 入 数据 


现 ， 高 速 公路 通行 


9 周期 性 和 趋势 性 。 


究 ， 本 文中 获取 
速 公路 股份 有 限 公 司 、 浙 
fi 连 岛 工程 高 速 公路 
的 月 通行 费 收入 历史 数据 作为 研究 对 象 ， 对 本 文 
数据 包含 了 12 家 公司 


辐 5 所 示 ， 给 出 了 上 三 高 
、2014 和 2015 年 经 过 标准 化 处 理 
表 中 数据 观察 可 以 明显 的 发 
定 的 相似 性 ， 呈 现 出 


出 未 来 一 年 12 个 
函数 ， 参 数 设 定 如 表 1 所 示 。 


-- 2013 年 
一 2014 年 
-2015 年 
和 10 12 
图 5 上 三 公司 2013 锋 前 行 费 收入 数据 
| GEP 算法 对 收入 增长 率 数据 进行 建 模 预 测 , 本 文 将 前 


48 个 月 份 所 对 应 的 收入 增长 率 数据 作为 GEP 模拟 的 输入 ， 输 


月 的 通行 费 收 入 数据 ， 采 用 式 (2) 作 为 适应 度 


下 
Tn 
Ud 


pp pe 


mn mn mm 


注 陪 洲 
Eq 
区 


参数 名 称 参数 说 明 
适应 度 函数 相对 误差 适应 度 函 数 
种 群 大 小 40 

迭代 次 数 10000 

数 集 严 ter A2 


fy 
4 
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3.2 


预测 结果 与 分 析 
以 浙江 上 三 高 速 公路 有 限 公 


司 等 3 家 公司 为 例 ， 分 别 给 出 


了 基于 GEP 的 混合 预测 算法 所 生成 的 模型 及 其 对 应 系数 值 如 


表 2 所 示 。 
a) 浙江 上 三 高 速 公 路 有 限 公 司 
y=2(@ 0 ) yy, , te) yy, , 
TY *((1— y, 020) /2 =(%. 3p J y,»)) (13) 
b) 浙江 舟山 大 陆 连 岛 工 程 高 速 公路 有 限 公司 
y= pO pn p + ,2p +)) 
+1/y,, 十 yp 一 0203 (14) 
c) 浙江 金 丽 温 高 速 公 路 有 限 公司 
受 
Yn 二 (> ， 一 yy]((a 万 as)(l ya) -oj 
teYn tp tasy, » —a4+1 (15) 
表 2 模型 系数 
公司 简称 
系 数 
上 三 公司 舟山 大 陆 连 岛 金 丽 温 公司 
a 2.09753716 6.48548845 -7.05450911 
0 9.31881755 -0.26039969 0.56163528 
as 0.34159015 8.014508627 1.77278106 
a -6.270612335 1.88449999 
as 8.084760236 -2.50950996 
将 12 家 公司 的 历史 增长 率 数 据 y,，, 和 y, 分 别 代 入 GEP 对 


应 生成 的 预测 模型 中 得 到 增长 率 预 测 值 y,,, ， 进 一 步 计算 得 到 
通行 费 收 入 金额 预测 值 ， 并 与 实际 值 进行 比较 分 析 。 表 3 给 出 
了 12 家 公司 在 本 文 方法 和 传统 预测 方法 下 的 未 来 一 年 通行 费 
收入 预测 精度 ， 同 时 给 出 了 模型 修正 前 后 的 精度 对 比 ， 用 年 相 


对 误差 来 衡量 预测 乡 


吉 果 的 准确 程度 。 


表 3 不 同 预测 方法 误差 比较 


预测 方法 (年 相对 误差 %) 


公司 简称 (编号 ) 
ARIMA ”神经 网 络 本 文 方法 ”修正 后 
沪 杭 甬 JT002000001 2.8903 16.3557 6.583 6.0875 
嘉兴 JT002002001 9.3164 10.4616 5.4047 4.9345 
上 三 JT002004001001 2.8374 3.8579 1.8258 0.6657 
金 甬 JT028000 18.5339 10.5626 2.6025 2.1480 
1 嘉 湖 杭 (分 )JT01500 3.2589 17.4046 3.1440 2.6785 
杭 金 衢 JT003000 21.4959 8.8121 2.0030 -1.4979 
宁波 前 台 温 JT007000 13.0169 9.6133 3.3026 3.1867 
甬 台 温 (临海 )JT005000 9.0417 15.1768 5.9624 5.4762 
舟山 连 岛 JT018000 2.3962 8.4832 1.6008 1.3849 
台州 前 台 温 JT006000 20.1735 6.4780 1.1714 ”0.6632 
金 丽 温 JT008000 5.3853 5.6084 1.9020 1.1660 
龙 丽 丽 龙 JT010000 8.2985 8.9276 6.0908 6.0908 


Chi 
: 基于 GEP na YR 


合作 捧 刊 > 


计算 结果 可 知 ， 在 预测 方法 上 ， 


除了 沪 杭 甬 公 司 


使 用 


ARIMA 模型 得 到 相对 较 小 的 误差 以 外 ， 其 他 公司 均 在 本 文 方 


测 模型 ARIMA 和 神经 网 络 表现 出 


法 上 有 更 高 的 预测 精度 。 另 外 ， 在 高 速 公路 通行 费 收入 受到 强 
烈 外 部 因素 的 影响 下 (例如 通路 、 封 路 、 旅 游 高 峰 等 ), 传统 的 预 
` 稳 定性 。 ARIMA 模型 在 捕 


捉 线 性 关系 上 的 局 限 性 和 对 时 序数 据 的 稳定 性 要 求 是 其 不 能 作 


出 准确 预测 的 原因 ， 而 神经 网 络 的 不 稳定 性 在 于 样 
经 网 络 的 各 层 参 数 不 足以 保证 训练 的 稳定 。 


pa 


够 大 , 


本 文 算法 有 较 强 的 适应 性 和 有 效 性 ， 

在 模型 修正 前 后 的 预测 精度 对 比 中 发 现 ， 人 1 
比 于 原 模型 相对 误差 更 小 。 修 正 模型 通过 分 析 
不 固定 性 和 时 滞 性 ， 对 当月 通行 费 增长 : 


进行 


EA 


多 正 ， 具 


本 数据 量 不 
比较 而 富 ， 


有 相对 较 好 的 预测 结果 。 
允 正 后 的 模型 对 
段 期 出 现 月 份 的 


办 局 


的 预测 精度 。 图 6 所 示 为 以 浙江 上 三 高 速 公路 有 


司 等 3 家 


公司 为 例 的 修正 


月 通行 资 收入 (万 元 ) 


卫 修 


前 后 通行 费 收 入 预测 值 和 实际 值 的 对 比 效果 。 


一 实际 什 
合 本 文 方法 


上 后 


6 
月 份 
(a) 浙 江上 三 高 速 公路 有 限 公司 


月 通行 费 收入 (万 元 ) 


(b) 浙 江 舟 山大 陆 连 


10500 


9000 


7500 上 


= 6000 


月 通行 费 收 入 (万 元 ) 


4500 } 


3000 
0 


(0) 浙 江 金 丽 温 高 速 公 路 有 限 公司 
行 费 收入 预测 值 与 实 


图 6 通 


对 比 图 可 


知 ， 本 文 方法 的 预测 值 曲线 和 实际 值 曲线 具有 


岛 工程 高 速 公路 有 限 公 司 


: 际 值 对比 


相似 的 趋势 性 和 波动 特征 , 拟 合 程度 较 好 , 但 在 春节 的 影响 下 ， 


预测 结果 和 实际 值 还 存在 一 定 差距 。 在 模型 修 


正 后 的 结果 中 ， 


录用 稿 


预测 值 对 于 真实 的 通行 费 收 入 在 主体 趋势 和 


节 部 分 都 拟 合 地 


更 好 。 以 图 
值 还 是 实际 值 ， 该 月 份 的 交通 收费 都 处 于 全 年 最 低位 


6 中 的 a 为 例 ， 可 以 看 到 在 二 月 份 时 ， 无 论 是 预测 
EE。 说 明 


了 原 有 算法 对 该 公司 交通 费 最 低 值 的 月 份 预 测 正确 ， 但 是 具体 
数值 仍 存在 一 定 偏差 。 同 样 在 a 例 中 ， 修 正 算法 在 捕捉 到 最 值 


点 的 同时 对 最 值 点 的 数值 作出 了 更 为 准确 的 预测 。 


但 在 菜 些 特殊 月 份 上 ， 算 法 过 于 保守 


响 ， 


总 体 上 ， 原 算法 能 够 对 通行 费 变 化 趋势 进行 较 好 的 预测 ， 
没有 考虑 实际 环境 的 影 
导致 关键 月 份 的 预测 值 存在 误差 。 基 于 此 本 文 所 引入 的 特 


定 月 份 增长 率 局 部 修正 ， 使 其 在 关键 最 值 点 的 精确 预测 上 有 了 


更 好 的 表现 ， 进 


4 


步 证 明了 本 文 基 于 GEP 混合 算法 的 有 效 性 


Ht 


o 


结束 语 


针对 高 速 公路 通行 费 预测 问题 , 本 文中 基于 GEP 基因 表达 


式 编程 理论 所 出 J 


种 精确 有 效 的 预测 方法 。 该 方法 充分 利用 


了 GEP 算法 对 复杂 函数 关系 的 建 模 能 力 , 确立 了 当前 通行 费 收 


入 与 历史 数据 之 间 的 发 展 关系 , 从 而 确保 了 预测 结果 的 准确 必 
此 外 ， 针 对 重大 节假日 (以 春节 为 例 ) 限 免 政 策 对 通行 费 收入 水 
平 的 影响 ， 本 文 在 原 模型 的 基础 上 进行 改进 ， 建 立 了 有 效 的 修 
正 模型 , 从 而 进一步 提高 了 预测 结果 的 精度 。 对 12 家 公司 提供 


Hf 


的 通行 费 数据 仿真 表明 ， 在 经 济 发 展 、 封 路 、 通 路 和 旅游 高 峰 


等 各 种 乡 
较 好 的 适应 性 。 


部 因素 的 影响 下 , 基于 GEP 算法 建立 的 预测 模型 具有 
最 终 的 预测 结果 和 误差 分 析 表 明 ， 相 较 于 传统 


的 预测 模型 ， 


本 文 方法 具有 更 高 的 预测 精度 ， 可 以 有 效 的 对 高 


速 公 路 通行 费 收 入 进行 预测 。 
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